Статья 9215

Название статьи

МЕТОД ПОЛУЧЕНИЯ ВЕКТОРОВ АКУСТИЧЕСКИХ ПРИЗНАКОВ ДЛЯ РАСПОЗНАВАНИЯ ПОСЛЕДОВАТЕЛЬНОСТИ ФРАЗЫ В УСЛОВИЯХ ШУМОВЫХ ПОМЕХ

Авторы

Стас Тамби Тахсинович, ведущий инженер-программист, Научно-производственное объединениеРоссийские инновационные технологии (Россия, г. Тверь, ул. Озерная, 14, к. 1), ttstas@npo-rit.ru
Щербаков Михаил Александрович, доктор технических наук, профессор, заведующий кафедрой автоматики и телемеханики, Пензенский государственный университет (Россия,г. Пенза, ул. Красная, 40), avitel@pnzgu.ru
Сазонов Владимир Васильевич, кандидат технических наук, доцент, кафедра автоматики и телемеханики, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), sazonov@inbox.ru

Индекс УДК

621.391

Аннотация

Актуальность и цели. Повышение точности распознавания речи в условиях наличия шумовых помех представляет собой важную задачу, поскольку существуют области применения систем распознавания речи, где, несмотря на растущую актуальность, существует проблема достижения высокой точности распознавания при наличии различных шумовых воздействий. Объектом исследования являются бортовые системы автоматического распознавания речи. Предметом исследования являются повышение вероятности распознавания речи в условиях шумовых помех. Цель исследования – разработка методов и алгоритмов повышения точности распознавания в условиях наличия шумовых помех.
Материалы и методы. Исследование методов распознавания речи в условиях шумовых помех выполнено с использованием нейронных сетей и скрытых марковских моделей.
Результаты. Разработан метод получения вектора акустических признаков на основе применения мел-частотных кепстральных коэффициентов. Основу разработанного метода составила новая формула обучения линейных однослойных нейронных сетей (ЛОНС), полученная с помощью применения двух целевых функций. Первая целевая функция – это вероятностная функция нормального гауссовского многомерного распределения, вторая целевая функция – это функция вычисления кепстральных коэффициентов на основе применения линейных однослойных нейронных сетей для вычисления средней спектральной мощности.
Выводы. Предложен метод получения вектора акустических признаков на основе применения мел-частотных кепстральных коэффициентов. Алгоритм обучения ЛОНС, основу которого составляет формула обучения, полученная на основе применения двух целевых функций, позволил повысить вероятность распознавания речи в условиях шумовых помех.

Ключевые слова

нейронная сеть, скрытая Марковская модель, распознавание речи, бортовая аппаратура.

 

 Скачать статью в формате PDF

Список литературы

1. Englund, C. Speech recognition in the JAS 39 Gripen aircraft -Adaptation to speech at dierent G-loads: Master Thesis in Speech Technology / C. Englund // Department of Speech, Music and Hearing, Royal Institute of Technology. – Stockholm. – 2004. – 11th March. – P. 1.
2. Vaseghi, S. V. Digital signal processing and noise reduction, fourth edition / S. V. Vaseghi. – London : John Wily and Sons Ltd Publication, 2008. – 466 p.
3. Dongsuk, Y. Robust speech recognition using neural networks and hidden markov models: Doctor of Philosophy / Y. Dongsuk. – New Jersey : Graduate school – New Brunswick Rutgers, The State University of New Jersey, 1999. – 18 p.
4. Giampiero, S. Mining speech sounds, machine learning methods for automatic speech recognition and analysis: doctoral thesis / S. Giampiero. – Stockholm : KTH school of computer science and communication, 2006. – 25 p.
5. Геппенер, В. Разработка систем автоматической верификации дикторов с использованием нейронных сетей / В. Геппенер, К. Симончик // Современные проблемы нейроинформатики. – 2006. – № 15. – С.14–23.
6. Фильтр с бесконечной импульсной характеристикой. – URL: https://ru.wikipedia. org/wiki/Фильтр_с_бесконечной_импульсной_характеристикой
7. Pассел, С. Искусственный интеллект – современной подход / С. Pассел, П. Норвиг. – 2-е изд. – М. : Вильямс, 2007. – 777 с.
8. Rabiner, L. Fundamentals of sрeech recognition / L. Rabiner, B.-H. Juang. – New Jersey : Prentice Hall, 1993. – 387 р.
9. Тихомиров, В. А. Математическая модель системы распознавания акустической последовательности фраз речи / В. А. Тихомиров, Т. Т. Стас // Необратимые процессы в природе и технике : сб. Всероссийской конф. (Москва, 26–28 января 2011 г.). – М. : Изд-во МГТУ им. Баумана, 2011. – Ч. II, № 11. – С. 140–144.
10. Дж, Т. Принципы распознавания образов / Т. Дж, Р. Гонсалес. – М. : Мир, 1978. – 242 с.

 

Дата создания: 31.07.2015 14:35
Дата обновления: 02.10.2015 09:18